查看原文
其他

用10行shell脚本监控Linux

雷哥 Cloud研习社 2023-06-06


雷哥喊你回来复习shell脚本了!!!

对运维来说,监控生产环境至关重要,尤其是在部署新应用程序时。如今,公司每天都使用开源解决方案来监控系统资源。但是,当出于测试目的而监视特定时间段时,bash 脚本会派上用场。

在本教程中,我们将编写一个 bash/shell 脚本,输出一个包含三列的表,显示我们机器上使用的内存、磁盘和 CPU 的百分比。该脚本将每 1 秒运行一段时间,并将日期以表格形式保存到日志文件中。

进入正题吧!

该脚本基本上由三个主要部分组成:

1.监控内存:


free -m | awk 'NR==2{printf "%.2f%%\t\t", $3*100/$2 }'
9.24%


free -m 是用于显示已使用和空闲内存的命令,输出如下:


[root@localhost tmp]# free -m
             total used free shared buffers cached
Mem:           996         92        904          0         11         31
-/+ buffers/cache: 49        947
Swap:         1583          0       1583


但是,我们需要从上面的输出中获取第二行的总内存和已用内存。从给定输出字符串中提取数据的一种方法是使用 AWK。

AWK是一种用于文本处理和数据提取的命令。它是大多数 UNIX 系统的标准功能。awk 'NR==2' 表示从第二行提取数据。$2和$3分别作为已用量和总量。


2.监控硬盘:



df -h | awk '$NF=="/"{printf "%s\t\t", $5}'
7%


第二个命令获取磁盘的使用情况。df -h 输出磁盘使用情况和分区相关的数据。


[root@localhost tmp]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/VolGroup-lv_root 14G 814M 12G 7% /
tmpfs 499M 0  499M 0% /dev/shm
/dev/sda1 485M 32M 428M 7% /boot


NF是表示有多少个字段,$NF代表最后一个字段。所以,df -h | awk '$NF==”/” '表示输出以"/"结尾的行。$5 将从该行中选择第 5 个字段。这可确保该命令获取正确的磁盘使用百分比(在我们的示例中为 %7)。

3.监控CPU




top -bn1 | grep load | awk '{printf "%.2f%%\t\t\n", $(NF-2)}'


top -bn1 命令将执行一次 top 命令(n1 = 一次迭代),当我们想在 bash 脚本中使用“top”或将其数据输出到文件时使用“b”。

“grep load”将输出包含字符串“load”的行。$(NF-2) 将计算该行上的字段数并减 2,因此输出第10个字段,即以下输出中的第一个 0.00。


[root@localhost tmp]# top -bn1 | grep load
top - 19:31:25 up  1:47, 1 user, load average: 0.00, 0.00, 0.00


在浏览完 bash 脚本的基本部分之后,我们需要将这些命令保存到变量 MEMORY、DISK 和 CPU 三个变量中:


MEMORY=$(free -m | awk 'NR==2{printf "%.2f%%\t\t", $3*100/$2 }')
DISK=$(df -h | awk '$NF=="/"{printf "%s\t\t", $5}')
CPU=$(top -bn1 | grep load | awk '{printf "%.2f%%\t\t\n", $(NF-2)}')


我们希望脚本运行一段时间,比如说一个小时。为了做到这一点,我们需要使用“while do”循环,每次循环后延迟 x 秒:


end=$((SECONDS+3600))
while [ $SECONDS -lt $end ]; do
echo "$MEMORY$DISK$CPU"
sleep 5
done


为了在一定时间内运行一个循环,我们可以定义一个变量 $end,它从 bash 脚本开始的时间开始计算当前的秒数,即 SECONDS,并在当前秒数上加上一个数字。所以一个小时就是 3600 秒。

上述代码片段的第二行指出,只要当前秒数小于(当前秒数 + 3600),while 循环就会继续执行。因此,我们定义了循环的开始时间和结束时间,以及将每个循环暂停 5 秒的睡眠时间。循环内部是每 5 秒分配一次新值的三个变量,以及将输出三个资源使用情况的 echo “$MEMORY $DISK $CPU”。

完整代码如下:


#! /bin/bash
printf "Memory\t\tDisk\t\tCPU\n"
end=$((SECONDS+3600))
while [ $SECONDS -lt $end ]; do
MEMORY=$(free -m | awk 'NR==2{printf "%.2f%%\t\t", $3*100/$2 }')
DISK=$(df -h | awk '$NF=="/"{printf "%s\t\t", $5}')
CPU=$(top -bn1 | grep load | awk '{printf "%.2f%%\t\t\n", $(NF-2)}')
echo "$MEMORY$DISK$CPU"
sleep 5
done


上面的代码将输出以下内容:


[root@localhost tmp]# ./stats.sh
Memory Disk CPU
9.34% 7% 0.00%
9.34% 7% 0.00%
9.34% 7% 0.00%
9.34% 7% 0.00%
^C[root@localhost tmp]#


将数据输出到日志文件:


[root@localhost tmp]# ./stats.sh >> log.txt



压力测试



由于我们的机器上没有任何负载,我们可以使用压力测试器stress命令,使 CPU 和内存负载运行一段时间。

stress命令的用法:https://linux.die.net/man/1/stress

使用以下命令(在 CentOS 上):


root@localhost tmp]# yum install stress
Failed to set locale, defaulting to C
Loaded plugins: fastestmirror
Determining fastest mirrors
epel/metalink | 4.2 kB 00:00     
 * base: ba.mirror.garr.it
 * epel: ftp.riken.jp
 * extras: centos.fastbull.org
 * updates: centos.fastbull.org
base | 3.7 kB 00:00     
epel | 4.3 kB 00:00     
epel/primary_db | 5.9 MB 00:37     
extras | 3.4 kB 00:00     
extras/primary_db | 37 kB 00:00     
updates | 3.4 kB 00:00     
updates/primary_db | 5.2 MB 00:30     
Setting up Install Process
Resolving Dependencies
--> Running transaction check
---> Package stress.x86_64 0:1.0.4-4.el6 will be installed
--> Finished Dependency Resolution
Dependencies Resolved
===================================================================================================
 Package Arch Version Repository Size
===================================================================================================
Installing:
 stress x86_64 1.0.4-4.el6 epel 36 k
Transaction Summary
===================================================================================================
Install 1 Package(s)
Total download size: 36 k
Installed size: 89 k
Is this ok [y/N]: y
Downloading Packages:
stress-1.0.4-4.el6.x86_64.rpm | 36 kB 00:01     
Running rpm_check_debug
Running Transaction Test
Transaction Test Succeeded
Running Transaction
  Installing : stress-1.0.4-4.el6.x86_64 1/1 
  Verifying : stress-1.0.4-4.el6.x86_64 1/1 
Installed:
  stress.x86_64 0:1.0.4-4.el6
Complete!


现在我们可以使用命令“stress”来给我们的服务器添加负载。例如,通过指定 2 个 CPU-bound 进程、1 个 I/O-bound 进程和 1 个内存分配器进程,对系统施加平均负载 4,如下所示。以下压力测试将运行 1 小时。


[root@localhost tmp]# stress -c 2 -i 1 -m 1 --vm-bytes 128M -t 3600s
stress: info: [1574] dispatching hogs: 2 cpu, 1 io, 1 vm, 0 hdd
stress: info: [1574] successful run completed in 3600s
[root@localhost tmp]# ./stats.sh 
Memory Disk CPU
20.48% 7% 1.21%
20.48% 7% 1.02%
20.48% 7% 0.94%
21.89% 7% 1.18%
20.68% 7% 1.41%
22.09% 7% 1.62%
24.10% 7% 1.81%
24.90% 7% 1.98%
32.93% 7% 2.14%
30.32% 7% 2.29%
20.58% 7% 2.63%
27.91% 7% 2.82%
20.48% 7% 2.59%
20.48% 7% 2.38%
20.48% 7% 2.19%
20.48% 7% 2.02%
20.48% 7% 1.86%

(全文完。翻译文章,侵删)



雷哥在这个暑假决定搞一件大事:带你学Linux  云计算  运维。

课程特色:

  1. 量身定制学习计划;
  2. 雷哥一对一答疑(集中做计划学习一个月,答疑有效期一年);
  3. 雷哥督促学习进度。
  4. 点我查看详情
长按下方卡片购买



推荐阅读



你不知道的tcp半连接、全连接全在这里了(1)

你不知道的tcp半连接、全连接全在这里了(2)

干货 | PXE+kickstart无人值守批量装机(原理与架构)

干货 | PXE+kickstart无人值守批量装机(实战部署)

ifconfig已淘汰,ip登场

Linux 云计算 学习路线(建议收藏)
放后台的Linux任务没有了,试试这个命令

Linux 网络状态工具 ss 命令详解

这次终于搞明白VLAN技术了

终于有人把敏捷、DevOps、CI、CD讲清楚了


除每周二、四、六定期更新的《Linux云计算一站式教程》以外,其余时间雷哥会推送一些工作中遇到的小知识、实战经验总结的文章。后续都会收录在“实战经验”合集中。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存